草庐IT

python - XML ElementTree - 索引标签

全部标签

html - 提取 HTML 文件中两个标签之间的数据

我的系统上保存了一个HUUUGEHTML文件,其中包含来自产品目录的数据。数据的结构使得每个产品记录的名称位于两个标签(name)和(/name)之间。每个产品最多有3个属性:名称、产品ID和颜色,但并非所有产品都具有所有这些属性。如何在不混淆产品属性的情况下为每个产品提取这些数据?该文件也是50兆字节!代码示例....'hat'blahblahblah'1829493'blahblahblah'cyan'blahblahblahblahblahblahblahblah'shirt'blahblahblahblahblahblah'193''dress'blahblahblahblah

xml - XSLT - 标签不匹配

我正在尝试将XLST与此XML结合使用:Name0Value1我现在的XLST是:现在在我看来这应该可行,但由于标签不匹配,我收到错误消息。但是我需要将两个block中的数据放在一个block中,但我不确定如何实现这一点。谢谢,詹姆斯。编辑:我正在努力实现这一目标:02如果我把if之外的标签,我得到:02 最佳答案 这可以通过一种非常简单的方式完成:应用于提供的XML文档时:Name0Value1产生了想要的、正确的结果:01 关于xml-XSLT-标签不匹配,我们在StackOverf

python - 使用带有转义字符作为参数的 XML 使用 WSDL url

我正在执行一个SOAPWeb服务的方法,该方法使用suds库接收3个字符串参数。第一个字符串参数应该是一个XML,另外两个是用户名和密码,这是我的半工作实现。fromsuds.clientimportClienturl="http://www.jonima.com.mx:3014/sefacturapac/TimbradoService?wsdl"client=Client(url)client.service.timbrado(XML_AS_STRING_HERE,'PRUEBA1','12345678')当第一个参数包含转义字符(&符号、引号、撇号、小于、大于)时,方法不起作用,因

php - 如何使用 PHP 访问 XML 中的多个相似标签

我有一个如下所示的XML。ThuOct2009:49:46+00002011@pkprasad82Hello133809164pkpraspravThuOct2009:49:46+00002011helloHello123456789pkpraspravin我只想访问php中两个“status”标签的“id”标签。我不需要任何其他标签。例如身份证=133809164id=123456789 最佳答案 您可以使用XPath检索此信息。作为参数传递给链接方法的位置路径是:/statuses/status//id

python - 下载没有 Python unicode 错误的 html

我正在尝试将page_source下载到文件中。但是,每次我得到:UnicodeDecodeError:'ascii'codeccan'tdecodebyte0xc2(orsomethingelse)inposition8304:ordinalnotinrange(128)我试过使用value.encode('utf-8'),但似乎每次它都会抛出相同的异常(除了手动尝试替换每个非ascii字符之外).有没有办法“预处理”html以将其转换为“可写”格式? 最佳答案 有第三方库如BeautifulSoup和lxml可以自动处理编码问题

python - 有什么方法可以知道 ElementTree DOM 消耗了多少内存?

假设您执行以下操作:dom=ElementTree()dom.parse(some_file_path)我想记录这个dom现在在我的进程中使用的粗略内存量。我不需要精确的东西,粗略的东西就可以了。我认为我无法从源XML文件的大小中得出它。我有一个500KB的文件,如上例所示,它在加载python进程后似乎增加了大约5MB的内存使用量。我查看了ElementTreeAPI,没有看到任何提供此信息的API。有人知道在解析/加载XML文件后了解ElementTree实例使用了多少内存的方法吗? 最佳答案 本质上,您想要查找特定python

c++ - 使用 TinyXML 获取标签之间的内容

如何获取标签之间的内容andEnterme 最佳答案 你真的应该看看优秀的documentationTinyXML以及thetutorial.但是,您正在寻找的是GetText()TiXmlElement的方法。一旦到达“name”或“mode”元素,就可以使用GetText()获取这些标签之间的字符串。 关于c++-使用TinyXML获取标签之间的内容,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com

python - BeautifulSoup XML 仅打印第一行

我正在使用BeautifulSoup4(和lxml)解析XML文件,出于某种原因,当我打印soup.prettify()时它只打印第一行:frombs4importBeautifulSoupf=open('xmlDoc.xml',"r")soup=BeautifulSoup(f,'xml')printsoup.prettify()#>>>知道为什么它没有抓取所有内容吗?更新:test 最佳答案 文件位置在EOF:>>>soup=BeautifulSoup("",'xml')>>>soup.prettify()'\n'或者内容不是有效

Python ElementTree find() 在 kml 文件中不匹配

我正在尝试使用元素树从kml文件中查找元素,如下所示:fromxml.etree.ElementTreeimportElementTreetree=ElementTree()tree.parse("history-03-02-2012.kml")p=tree.find(".//name")该文件的足够子集如下所示:Locationhistoryfrom03/03/2012to03/10/2012“名称”元素存在;为什么搜索结果是空的? 最佳答案 您尝试匹配的name元素实际上位于KML命名空间内,但您并未考虑该命名空间进行搜索。尝试

html - 如何将所有 "LF"字符转换为 "<br/>"标签并显示在 HTML 页面上

如何转换所有LF字符到标记并将其显示在HTML页面上?我有以下示例XML文件:Line1Line2Line3Line4Line5Line6我想在HTML页面上显示所有行。为此,我使用以下XSLT转换:当我在Firefox中打开该XML文件时(我使用浏览器显示XSLT转换)我将看到该结果:Line1Line2Line3Line4Line5Line6如您所见,LF字符未被替换标签。但是当我使用其他字符串时,例如EOL:EOL我会看到预期的结果:EOLLine1EOLLine2EOLLine3EOLLine4EOLLine5EOLLine6EOL问题在于转换/显示标签。